本文介绍了一个名为Bangrawriting的孟加拉手写数据集,其中包含260个不同个性和年龄的个人的单页手写。每个页面都包含边界框的边界框以及写作的Unicode表示。该数据集总共包含21,234个单词和32,787个字符。此外,该数据集包括5,470个孟加拉词汇的独特单词。除了通常的单词外,数据集还包括261个可理解的覆盖物和450个手写罢工和错误。所有的边界盒和单词标签都是手动生成的。该数据集可用于复杂的光学字符/单词识别,作者识别,手写单词分割和单词生成。此外,该数据集适用于提取基于年龄的和基于性别的笔迹变化。
translated by 谷歌翻译